李世石首战惜败AlphaGo,现场棋局解析
海归学者发起的公益学术平台
分享信息,整合资源
交流学术,偶尔风月
3月9日,万众瞩目的谷歌DeepMind围棋人工智能程序AlphaGo与世界围棋冠军李世石的巅峰对决打响了第一战。令人遗憾的是,李世石在首盘比赛中输给了AlphaGo,他能否像之前宣传的不受首盘影响,4:1扳回力挽狂澜呢?让我们拭目以待。现就首盘棋局作一介绍。
北京时间3月9日中午12点整,李世石与AlphaGo的人机大战在韩国首尔四季酒
店拉开帷幕。
为了以最好的状态迎战,李世石特意理了更清爽的发型。有趣的是,人类冠军旁边摆着韩国国旗,而AlphaGo则替英国征战,由一名棋手通过观看电脑屏幕在棋盘上代下。现场评论员为美国围棋协会的Chris Garlock和专业九段选手Michael Redmond。
李世石执黑先行,而AlphaGo第一步思考了1分半的时间,边星起手。
AlphaGo试图进攻右上角 (以下均为李世石视角),双方在此区域纠缠了一番。
在时间上,起初李世石优势,半小时后~花费更多时间。运算速度的优势?比赛进行到40分钟后,棋盘中上部发生了激烈碰撞,黑白双方不停地进行着连和断,正所谓“棋从断处生”。现场解说也表示:“他还是第一次看到AlphaGo直接参与这样激烈的厮杀。”
约50分钟时,Alpha在中部小尖了一手,尝试突围黑棋的包夹之势。李世石应对得力。
近60分钟,李世石尝试把战场拉向下部,但AlphaGo仍然在顶部努力,此后它也花了更多的时间转向中盘的拉扯。李在时间剩余上重获优势。
中场的争斗并非一时能有战果,李世石虎了一步,身经百战的AlphaGo当然不会轻易进坑,中场形势对两边都非常危险。双方一路齐头并进,奔向下方边线。
95分钟后,战火燃至左下,白方路数激进,角逐一阵后转战右方。几经辗转,局部形势逐渐明朗,右上角被AlphaGo占到便宜,李世石的三颗黑子未能存活。
盘中评论员甚至有感而发:“无论最后结果怎样,可以看到,AlphaGo的棋路绝对是职业水准,这已经是巨大的成功!”
“这场比赛我们可以看到AlphaGo很大的进步。之前与樊麾对阵的五场比赛,它显得非常保守,而今天这一场对决令人激动万分,双方都表现地都很有侵略性,能够看到AlphaGo这样去下棋真是很棒。”
当比赛进行到3小时,李世石剩余时间37分钟,AlphaGo则还剩28分钟。盘面局势极为接近。而当AlphaGo还剩7分钟时,李世石还有33分钟,整体局势基本已定,即将进入官子阶段。从盘面看,白方似乎更占优势。对于人工智能来说,对时间的利用和掌握真是恰到好处。
在比赛进行到3小时32分,AlphaGo还剩5分半的时间时,李世石开始计算目数,据评论员估算,AlphaGo应该已经胜了。几分钟之后,也就是北京时间下午3点36分,最终结果正式公布,人机大战第一场,AlphaGo取得胜利。
全场比赛,李世石出现了一些职业选手常会出现的失误,AlphaGo则基本没有出现破绽。
在本周一的新闻发布会上,李世石与DeemMind创始人Demis Hassabis以及Alphabet执行总裁Eric Schmidt一同出席在聚光灯下。尽管夹在两人的中间,这位年轻的韩国棋手显得镇定自若。上个月他曾表示:“这不会是一场实力接近的比赛,我想最终结果将是5:0或者4:1。对我来说,最重要的是不要输掉那一场。”
然而在比赛前夕,李世石表现出了一点担忧:“机器与真人有着很大不同,一般来讲,你可以感受到人类对手的呼吸,感受到他们的能量。很多时候,你是通过面前对手的一些细微反应来决定下一步行动的。但如果对面是台机器,情况就不同了。AlphaGo可以模仿人类的直觉,要大比分获胜可能有点压力。”
在听过AlphaGo的算法介绍后,李世石也降低了一点自己的预期。他表示:“如果说人类可以算1000步棋的话,那么计算机能够计算100万步,并能缩小范围,这确实有点威胁。尽管如此,计算机在比赛的时候无法体会围棋项目的魅力与伟大,我会尽力捍卫人类的价值。”
赛程:第一局3月9日、第二局3月10日、第三局3月12日、第四局3月13日、第五局3月15日,北京时间中午12时开赛。
赛制:比赛采用中国规则,黑贴3又3/4子 (黑贴7目半)。比赛用时每方2小时,1分钟读秒3次。
奖金:五局三胜,胜者可获100万美元奖金。另外,李世石下满五局可获15万美元出场费,每胜一局可获2万美元胜局奖金。如果李世石五战全胜,最多可获得125万美元。
DeepMind的AlphaGo曾战胜欧洲围棋冠军樊麾,引起一阵波澜。不过围棋在欧洲并不是一项重要项目,樊麾属于业余选手中的顶级水平,其世界排名约为第800位,相当于二段水平。相比之下,李世石目前世界排名第一,是名副其实的九段选手。
早在2014年,Alphabet以5.8亿美元收购了初创公司DeepMind,看中的就是其开发的能够应战古老围棋游戏的神经网络系统。围棋对于人工智能来说是最难以掌握的一个项目,但是他们开发的AlphaGo融合了高级树状查找和深度神经网络。通过对神经网络进行的3000万步训练 (所有棋谱均来自人类专业棋手的比赛),AlphaGo预测出人类对手下一步走法的正确率已经达到了57%,之前的纪录是44%。
2016年1月27日,Nature曾刊登封面文章《Mastering the game of Go with deep neural networks and tree search》,详细介绍了Google Deepmind开发的人工智能AlphaGo。
DeepMind创始人Demis Hassabis曾表示,AlphaGo正在突飞猛进,甚至会超越最棒的人类选手。能够看它在围棋规则内去创造新的东西,感觉很神奇。我们对自己创造的这个系统有种很密切的感情,特别是它被创造的方式——它会学习,我们也会教它,它的风格就像人一样。和其他编出来的程序不同,你不知道它到底都会什么,因为它能够自己学习。
人机首战无疑是最关键的一场比赛。AlphaGo拿下的这一分意义非凡,它是人工智能的标志性胜利——在公平环境下战胜人类的最高水平。即使后面被李世石4:1翻盘,这也已经为我们带来了足够的想象空间。当然,李世石究竟会在后面扳回劣势,还是重蹈樊麾覆辙,我们还要拭目以待。
在初战失利后,这位33岁的人类顶尖棋手还将在接下来的一周内与人工智能进行四场比赛。
媒体转载请联系授权
service@scholarset.com 或微信ID: scholarset
回复“目录”或“分类”,浏览知社更多精华。长按二维码识别,可以关注/进入公众号进行回复。